Bases de datos paralelas

Sistemas paralelos

Los sistemas paralelos utilizan varias CPU y discos que son capaces de ejecutar operaciones en paralelo.

Desde el punto de vista de las bases de datos, un sistema paralelo busca mejorar el tiempo de respuesta ante consultas de usuarios.

En los sistemas paralelos podemos distinguir dos tipos:

La utilización de bases de datos paralelas buscan aumentar:

 

Ventajas y desventajas del uso de bases de datos paralelas

Arquitecturas paralelas

Memoria compartida

La memoria se comparte para todos los procesadores.

La principal ventaja de esta arquitectura es la comunicación directa que existe entre los procesadores. Sin embargo, la vía de comunicación se puede convertir en su principal desventaja, ya que, si existe un alto tráfico de información, la espera de cada procesador aumenta significativamente. Por ello, los procesadores que se utilizan en esta arquitectura suelen tener una memoria caché mayor.

 

Memoria_compartida

 

Disco compartido

Todos los procesadores pueden acceder directamente a todos los discos del sistema, eliminando así los problemas de acceso a memoria, pues cada procesador tiene su propia memoria.

Las principales ventajas de esta arquitectura son:

 

Disco_compartido

 

Sin compartimiento

No se comparte ni la memoria ni el disco. Cada nodo dispone de su propia memoria y de uno o varios discos.

Esta arquitectura es más ampliable y puede incorporar un mayor número de procesadores, sin embargo, el coste de comunicación y acceso a discos remotos es mayor.

 

Sin_compartimiento

 

Jerárquico

Es una solución combinada de las anteriores.

 

Jerarquico

 

Tipos de paralelismos

Paralelismo en consultas

Hablamos de paralelismo en consultas cuando una consulta se ejecuta en paralelo en diferentes procesadores.

La ejecución de una consulta en paralelo puede llevarse a cabo mediante dos alternativas que se pueden combinar:

 

Paralelismo entre consultas

El paralelismo entre consultas se refiere a la ejecución en paralelo de varias consultas.

El tiempo de transacción es el mismo, pero incrementa la productividad. Buscamos hacer más en el mismo tiempo.

Al tratarse de lecturas en paralelo, hay que asegurarse de que la lectura de los datos se realiza sobre una copia válida de los mismos, pues pueden haber sido modificados por otras operaciones. Este problema se conoce como coherencia de cachés y afecta a todos los sistemas paralelos, no solo a bases de datos paralelas.

 

by Jose Manuel Pinillos